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PKOOEDE POUR PREVOIR, I DENT I. F I ER ET DECRTRE DES MOLECULES 
oy^FPTIBLFS DK PPESEHTEP UN COM PORTEMENT RECHERCHE, 
NOTAMMEl'iT DANS M DOMAINE DE LA PHAPMACTE E' T MOLECULES" OBTENUES 

PAF CE PPOCEDE. 

L' invention concer ne La model isat ion moleculaire. 
File a pour objet un nouveau precede utilisant un certain 
nornbre molecules de depart, not.amment mars non seulement. par 
chimre combinatory virtuelle, pour prevoir, identifier et 
10 desire des molecules suscept ihlos de presenter un comportement 
rr-herrdvi, nctammetit dans le domains de la pharmacie. 

,- )r sa ,r que la recherche de nouvelles molecules actives, 
notamment dans le domaine de la pharmacre, necessite La syrithese 
d-un tre, grand nornbre de molecules qu'il faudra ensuite tester 
,5 in vitro ou in vivo. Dans le mei.lleur des cas, seul un tres 
p.= tif nornbre de ces molecules se revel era actif . 

P.,ur tenter de rationaliser la recherche de nouvelles 
r , 1 er-ul-- act ives on a eu 1 ' idee de reoourir a la moderation 
m-d^cularre en utilisant des bases de donnees inf ormatisees . Les 
r^s.Ua-s obtenus avec les techniques de ce type qui. sent 
jusou'a present, ne sent pas tou jours satistaisants, en 



connues 



n raison d'une definition insuffisante des 



parti culier 
parametres et des cri teres d'activite. 

La presente invent ion a pour but de remedier , au morns en 

^5 partie a ces inconvenients . 

" ce but est atteint selon 1' invention qui off re un precede 
pour prevoir, identifier et decrire des molecules ayant un 
comportement recherche. xeouel precede est base sur la 
conception assistee par ordinateur et le criblage, egalement 

30 a ^i.te par" ordinateur, de barques combinatoi res virtuelles. Ce 
procede utilise different, desc r ipteurs topologiques , de forme, 
'chimin. Physiques etc. en combinaison avec une nouvelle 
analyse des ' tra j ecto ires de dynamique moleculaire. Le terme de 

r - liro " ;„-t ivi te" au sens bioiogique ou 
"comportement" signi t une i^wm. 

,5 pharmacologic, : orsque les molecules concernent des secteurs 
d' application ph irmaceut ique , ou une "propriete" au sens 
phY sico ehlmique, ousque les mole-nlcs ooncernent des secteurs 



d ' apt • 1 i cat ions non pharmaeeut iques , par exemple des mat er iaux 

tels que des pol^Tiier es . 

Plus precisement , 1' invention a pour objet un precede 

ass i st e par ordinateur pour prevoir, identifier et deer ire cies 
5 mol ecules ayant; un compor torrent recherche , notaoient dans le 

domaine de la pharmacie, lequel precede comprend essentiel lenient. 

les etapes success ives consistant a : 

1) realiser une base d ' apprent. i ssage a partir d' 

s t ructures moleculai res voisines connues composees d'une part de 
10 structures moleculaires actives connues pour presenter 

1 'activite recherchee et d' autre part de structures moleculaires 

inactives connues pour etre depourvues de cette activite ou pour 

presenter une activite recherchee faible, en utilisant des 

desc ripteurs appropr ies ; 
1 5 ;■ ) generer une serie de structures moleculaires, 

pre ferent.iel lement de structures moleculaires voisines , 

notamment par explosion combinatoire, a partir de la base 

d' apprent i ssage ; 

3) effectuer un criblage des molecules ainsi generees 
2() sur la base de 1 ' enrichissement , en termes de diversite 
moleculai.re, apporte par chaque molecule vis-a-vis des 
de scrip t e urs c h o i s i s ; 

•1) soumettre les molecules ainsi retenues a des filtres 
stat iques repr esen tat i f s des contraintes de variations 
25 structurelles, physico-chimiques et moleculaires auxquelles 
doivent repondre les molecules pour etre actives et, 
eventuel Lement , synthetiser et tester les molecules 

selectionnees ; 

L 5) soumettre les molecules les plus prometteuses ainsi 
30 selectionnees a un filtre dynamique representat i f des 
contraint.es de variation conf ormat lonnel le que doivent respecter 
les molecules pour etre actives ; 

6 ) synthetiser et tester les molecules ainsi 

se 1 e s t i oomees ; 

35 /) sr le resuitat escompte n'est pas obtenu, ou s'rl 

n'est. obtenu que part iel lement , repeter les etapes J , ) a 6) en 
• t i i i ant 1 es lilt res . 



en 



L' invention conceme egalement una molecule qui 

- , ., • . nro'-pnt pr un compor tement 
r /Pfai! pas anter ieurement cctmue pom :>: ' : " Jn 1 

recherche caracterise er. ce qu'elle occupe un espace 
cnformat iennel identique ou t res voisin de 1 ' espace 
conformational d'une molecule de reference au morns, la 
molecule de reference otant proalablement connue pour presenter 
le comportement recherche. La notion de "t:res voisin" .s'apprecie 

U1 , HciC , pqnnres con format ionnels 

•i ^.n,^ t -pct-ees S^ront par exemple 
-vrresp'-'iidant: aux molecules Ll.oU..l. . 

consrde.es c« " t,:es voisins- les 10* ^spaces 

conformationnels les plus proohes de 1 ■ espace conf ormat ,onnel 

des molecules de references. , 

Lorsque le precede s'appuie sur une pluralrte de 
molecules de references, on considered comme - tres voisins" les 
espaces conf. ormat: fennels des molecules de reference. 

Pour realiser une base d< apprentice, on utilise des 
descriptors var.es qui peuvent etre toutes sortes de proprietes 
quantitative* et,ou semi • quant Ltatives . Par exemple, comme ce,a 
o, t connu de V homme du metier, a partir de la representation 
qraphique d'une molecule, en d'autres termes une representation 
,n deux dimensions, ou representation 2D, d'un compose chimique, 
on p, ut deduire un ensemble de valeurs numeriques appelees 
•■descriptors topologies". On pent en outre utiliser des 
descripteurs refletant certaines proprietes physico-chimiques 
comme par exemple le caractere lipophile. ou lipophilie, qui est 
exprime en tant que logP, P etant le coefficient de partition du 

compose consider* entre 1 ' eau et le n octanol, ou la 

refract ivite molaire. On pent en outre utiliser des descripteurs 
numeriques representant des formes moleculaires . 

, • . r.i-,-MTiipraent utilisees dans les 
Les techniques classiquemciiL 

t rU , structure activite (Quantitative 

correlations quant ltatives uc ' ,; 

Structure Activity Relationships : QSAR ) sent basees sur 
;, iy!! , !t :,:v que si une molecule presente un comportement 
biolooique donne, toutes les informations necessaires pour la 
rara ,t.riser se fondent tortenent sur sa structure, e'est-a-dire 

..... , ; ~t ses formes. Contrairement au 

c;es atomes, ses. liaison.. > 

iin(1(li , (1 rUssiquo dans lequel 1 'activite 
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biol ocjique pout etre exprimee sous la forme d'une combina i son 
lineaire do descnpteurs pertinents, hi Demanderesse utilise un 
paracligme do representation d' informat Lons ou mappage variable, 
nori lineaire, dans lequol 1'activite est une fonction non 
1 ineaire de descr ipteur s structuraux, t opol og i ques et 
ruo 1 ecu la i res . 

Selon 1 ' invent ion , on analyse un ensemble de descripteurs 
pour les composes actifs, en opposition aux composes inactifs, 
ce qu i permet la definition de f litres pour fajre la difference 
entre les deux classes de molecules [G. Grassy k al . , J. Mol . 
Graphics, vol. 13, page 35b {1995)]. 

Si 1 ' echantil Ion d ' apprent issage correspond a des tests in 
vivo, le jeu de filtres decrit les conditions d'activite in 
vivo. Dans le cas des tests in vitro, le jeu de filtres decrit 
les conditions d'activite in vitro. 

Un f litre est: defini par la plage de variation d'un 
descr ipteur donne pour tous les composes actifs connus lorsqu'on 
la compare a la plage de variation du meme descr. ipteur pour tous 
les composes inactifs connus . 

Si la plage "active" recouvre total ement la plage 
"inactive", le £ litre ne sert a rien, ce qui revient a dire que 
]a variation de ce descripteur particulier n' a pas de relation 
avec 1 ' act ivi te biologique . 

Si la plage "active" ne recouvre pas totalement la plage 
"inactive", toute molecule presentant pour ce descripteur une 
valeur qui tombe dans une zone de la plage "active" qui ne 
recouvre pas la zone "inactive" aura une forte probability 
d'et r e ac t i ve au s s i . 

Les aptitudes a la prediction de ce type d'approche sont 
ameliorees par 1 ' ut i 1 i sat ion de plusieurs filtres, 

preferentiellement 10 a 30, chacun representant une maniere 
differente de quantifier les proprietes s t ructurel les et 
phys i co ehrmiques d ' une molecule . 

Cos filtres, une fois etablis, peuvent etre utilises pour 
cribler des composes virtuels generes pendant une explosion 
eomhinut < c re , c'est -a dire t ■ ns les composes obt enus par exemple 
i>\\ branchant une liste do substituants sui des parties 



predetermines d'un noyau structure! appele synthon. Les 
composes les plus prometteurs, a savoir ceux qui satisiont a 
toutes les ,ontraintes defimes par les filtres, sent: ensuite 
synthetases par synthese chimique ou par genie gonetique, ou 
encore par tout autre moyen. et testes dans des essais 
bioloqiques . 

Les molecules mactives que 1. ' on avalt. predit.es actives 
contiennent des caracter 1st Lques inexpiorees qui sent 
determinants pour 1 ' act iv i t e . De telles proprietes sent 
uti Usees pour la definition ■ • iiiltres addi tionne 1 s et , apres 
quelques repetitions, le processus de criblage virtuel peut etre 
utilise pour 1 ' identification exacte de composes presentant les 
proprietes recherchees . 

En pratique, a partir des structures de depart dont 
1'activite peut etre mesuree In vitro et/ou in vivo, on realise 
une ' "base d ' apprent issage " en determinant ies differents 
parametres physico-chimiques , structuraux et moleculaires 
permettant: de decrrre les molecules actives et les molecules 
iriact.ives . 

Ces parametres sent represents sous forme de plages de 
variations, ou "contraint.es", en fonction des classes 
d'activite. Un jeu ou ensemble de contraintes definit un filtre. 

La qualite des descr ipteur s choisis est controlee en 
termes de variabilite, ainsi que le choix des descripteurs a 
utiliser et l'intercorrelation entre les descripteurs retenus. 

Ceci peut. etre realise en utilisant un logiciel congu par 
K. Lahana, le logiciel ANODA (ANalysis Of DAta) qui associe a 
une chiiniotheque une "carte de vrsite" simple en termes de 
descripteurs de base et d' analyse en composant.es principales. 
Differentes techniques de selection des descripteurs telles 
qu" analyses de variabilite, d' intercor relation, de 

representative te (regressions, reseaux de neurones, algorithmes 
genet. iques) sont mises en oeuvre . 

Une explosion combi natoi re est generee a partir de la base 
d< apprent issage et en prenant en compte ies .renditions de 
variation utiles pour chaque position variable. Pour ce faire, 
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il est. possible d'util iser des bases de donnees de subs r. i t uant s 
definis par leur structure et 1 es descripteurs qui en decoulent. 

I/expIosion comoinatoue pou* etre qeneree en ut ilisant du 
Logiciel LEG10M de la secrete IRI.POS ou un autre logiciel concu 
oar R. Lahana, le logiciel COMBEX qu ; c ree une telle explosion a 
part; i r d ' un repart r teur ( " scaffold" ) ou d ' une sequence 
'•onserisus, et d ' une liste de contraint.es sur chacun des points 
do substitution. Un langage de comiaande de type SQL (Standard 
'.»uery Language) permet. de combiner a volonte toutes sortes de 
« -ondi t i ons de so .1 ect ion des subs 1 1 tuants . 

Pour chaque combinaison gene ree , il est possible de 
verifier 1 ' ear ich i ssement en terme de diversite moleculaire 
apportee par la molecule creee vis-a-vis des descripteurs 
ehoisis. Si. cet enr ichissement est suffisant, la molecule est 
.■onservee, smon elle est rejet.ee. 

L'enrichissement en terme de diversite moleculaire peut 
. *r..re ver if ie au raoyen d ' un logiciel concu par R. Lahana, le 
; 0 giciei D1VERSER qui permet. d'effectuer une evaluation 
quantitative de la diversite moleculaire presentee par une 
ohirniotheque quelconque, meme si. les molecules qui la cornposent 
sent hautement flexibles et si. cette chimiotheque est purement 
virtuelle. Ce logiciel permet de comparer des banques en terme 
de diversite, de caracteriser des "trous" de diversite dans une 
banque, de concevoir rat ionnel lement des banques minimales ayant 
une diversite maxima Le. Les techniques de selection peuvent etre 
par exemple la classification hierarchique (clusters), des 
partitions, la conception unitorme (uniform design), le trrage 
aleatoi re , etc . 

Les f litres " s tat iques " , c'est-a-dire ceux qui ne 
dependent pas de la variability conformat ionnel le des molecules, 
deerivent les intervalles des valeurs structural.es, physico- 
c h i m i <qu e s , mo 1 e c ulaires, aux^ieis les molecules do i ven t 
corresponds? afin d'etre actives. En utilisant ces filtres 
statiques, • >:: deduit les molecules ayant le plus do chances 
d'etre act ivos. Ces molecules sent even tue 1 lement synthetisees 
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Dans cette etape, on peut uuliser un logiciel con C u par 
G. Grassv, 1, logiciel VARIMAP qui. etablit des filtres staUgues 
a parrir de descriptors obtenus P ar TSAR mi est un logiciel 
commercialise par Oxford Molecular Group Oxford < Royaume -mil et 
S dont les auteurs initiaux sent G. Gr assy et R. Lahana . 

pes candidates les plus promett eurs select ionnes au moyen 
des filtres statiques sent ensuite soumis a un filtre dynamique, 
r > -st -a-dire representatif des contraintes de variation 
ronformationneile que doivent respecter" les molecules generees 
10 pour avoir des chances d'etre artive., par comparaison avec 
celles de la base d ' apprent r ssage . 

Ce lilt rag,- dynamique peut etre effectuee au moyen d'un 
loaiciel nouvellement congu par G. Grassy, le logiciel MULTIDYN 
qui peraet, a partir de traj ectoires de dynamique moleculaire, 
,5 de caracteriser les espaces conformationnels de molecules 
quelconques. Les conformations bioactives des molecules en 
question sent ainsi mises en evidence. 

Les molecules revenues sent ensuite synthet isees et 

•>0 tfc " Si I'activite biologique trouvee r,e repond pas ou ne 
repond que partiellement aux criteres attendus, les etapes de 
verification de 1 < enrichissement en terme de diversite 
moleculaire, de filtrage statique, de filtrage dynamique, de 
synthese et d'essais sont repetees . 
25 si on trouve que des molecules repondent aux criteres 

biologiques fixes, le but est atteint. 

Le precede selon 1' invention permet done de definir de 
nouvelles molecules actives par un processus entierement 
rationel n'utilisant a aucun moment d' hypo these sur leur 
10 mecanisme d' action possible ou sur leur recepteur eventuel . 

Le precede selon 1' invention a ete mis en oeuvre avec 
succes dans des domaines de pharmaco -modulation de molecules 
afin d'ameliorer les performances de ces molecules in vitro et 
sur tout in vivo. 

35 -example detaxlle de mise en oeuvre qui suit sert a 

il lustrer et. mieux expliquer ['invention. 

EXEMPLI 



x 



Obtention de nouveaux composes immune -modulateurs 
on a rocemment. montre que Le peptide 2702.75-84 (peptide 
derive du HLA-B2702, acides amines 75 a 84) prolonge, chez la 
souris, la survie apres une alio greife du 

5 coeur. (Transplantation, vol. 59, page 455 (1995). 

L' administration du peptide 2702.75-84 a raison de 
80 mg/kg/jour pendant 10 jours apres la transplantation de 
coeurs B6 chez des receveurs CBA prolonge la survie a l'allo- 
greffe de coeur jusqu'a 1.1,4 2,6 (n = 8) jours compares a 8,2 1,2 
10 jours chez les animaux temoins non trait.es (p<0,01). Aucun effet 
sur la survie a la greffe n'a ete observe apres une therapie 
avec le peptide 2702.75-84 a des doses inf erieures . 

L'activite in vivo de plusieurs peptides (n=19) derives du 
peptide 27 02.75-84 et d'autres sequences MHC/HLA a ete evaluee 
15 de fagon similaire. Les peptides testes comprenaient des 
peptides de types acides amines D et L. Certains peptides 
differaient du peptide 2702.75-84 sur jusqu'a six positions 
d' acides amines, d'autres avaient une sequence inversee . 

Tous ces peptides dont les sequences sont representees 
20 dans le tableau I qui suit:, ont ete synthet ises en utilisant la 
ohimie V moc tBu puis testes . 

Les etudes de reponse aux doses sur des souris ayant regu 
une allo-greffe de coeur ont ete effectuees en utilisant des 
peptides sous la forme acetate, purifies a plus de 9 0% par 
25 chromatographic 1 i qui do haute performance (HPLC). 

La transplantation cardiaque heterotrope abdominale a ete 
erf ectuee commo decrit precedeniment; J. Thorac . Cardiovasc . 
Surg. , vol . 7 , page 22 5 (1969) . 

Des souris CBA receveuses de coeurs C57B1/6 ont ete 
30 traitees quotidiennement. avec dif f erentes doses de peptide apres 
la transplantation d'organe. Les peptides etaient dissous dans 
du DMSO et dilues dans du PBS (concentration finale en DMSO 10%) 
avant 1 ' adrri ni s t ra t i on intraper i toneale . Les animaux ont ete 
r.raites a part i r du t >ur de la transplantation jusqu'au 9eme 
35 jour'. La survie a la greffe a ete surveillee quot idiennement par 
palpation directe et le rejet a ete defini comme la fin de la 
contract i 1 i to cardiaque palpable. La significance statistique de 



.la prolongation de survie a 1 ' al I o-gref le clu coeu, a etc 
calculee en utilisant le test de Mann-Whitney. 

La therapie des receveurs de coeur de sour is alio- qreff e 
avec certains de ces peptides (n = 9 ; en gras dans le tableau T 
qui suit) a permis une prolongation significative de la survie a 
la greffe, alors que les autres n'avaient. pas d'effets 
signif icatif s . 

Les structures des peptides utilises et les resultats 
obtenus sont present.es dans le tableau 1 qui suit. 
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TABLEAU I 



S equen c e p e p t 1 ■ 1 i q u e 


HLA/MHC 


MSTSD 


IJon tidi to 




7,5 1,1 


RENLRIALP Y 


B2 7 02 


1 1 , 4 2 , 6 


YRLAIRLNEK 




12 ,1- 2 , 8 


i;gn 1 r is. 1 ry 




11,4 4 , .1 


y i" 1 ci i 1 no ? 




13,2 2,7 


PVNLF IALFY 




1 1 , 5 0 , 5 






12 , 5 1, 6 


>"\/"Pi 1 T" 1 1 ■ ' 

1 V 1 1 1. J.. -I- CA -L X t 




13 21 3,9 


\ r r~ 1 i r 1 nvi 




12, 2 2,9 


TJT ,R T ALR YYVJ 




11,6 1,3 


P\^tJT .FTALF Y 


Kk 


8,5 0,7 


P\/ni .PTI jI .RY 

1 v V i— ' J 1 1 I- J. 1 1 J 1 1 V. 1 


Dk 


7,0 0,5 


PVDKPTLT j(JY 


Kb 


7,8 1,0 


iV V O J-J IT J. N J 1 -Lt^_J 1 


Db 


8,0 0,5 


RESLRLLRGY 


07 


7,5 0,7 


PEDLRTLLRY 


B2705 


7,7 1,2 


ENLRIALR 




8,5 0,7 


renlpial ry 




9,5 2,4 


RVNLRTLRRY 


E 


8,0 0,5 


RMNLQTLRGY 


G 


7,5 0,7 



12 ensemble des 19 peptides a ete utilise comme base 
d ' apprent i.ssage pour definir la strategie de conception 



5 rat ionel ie . 

Bien que ret ensemble de depart soit tres petit, il a 
permis, commo L- demerit re la distinction initiale entre les 
composes act if s ot les composes inactifs, une definition 
ef f icace des cont raint.es . 
10 mi tialement , 27 descr ipteurs independants de la 

c( >ni orrnat l on ont ot e ealcules [jour chaque peptide (voir ie 
Tab I caw II c i arn es ) . 
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Les descripteurs physico-chnnujues et t opoloqiquer. ont et.e 
generes par le logic; iel TSAR V? . 1 (Ox! ord Molecular Group, 

Oxford, F.oyaume Uni) - 

Ces 27 descripteurs comprenaient ie moment dipolarre, 
calcule sur la base d'une conformation totalernent developpee de 
chaque peptide. L ' analyse statist ique a montre que 14 
descripteurs et.aient intercorreles . Par consequent, lis 
n'etaient pas utiles pour la definition de contraintes qui 
differencient entre les peptides actifs et les inactifs. Les li 
autres descripteurs, independants de la conformation, ont ete 
utilises pour construire un filt.re s tat ique pour le criblage 
d'une bibliotheque combinatoire virtuelle comme decrit plus 
loin . 

TABLEAU II 
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L es 27 desc ri pteurs topological 
<pt_ ph ysicochim iques utilises 



Propria te 


Nature 


Indus /exclu 


Masse molaire 


Phvsicrue 


Exclu 


Volume ellipsoidal 


Forme 


Indus 


Volume moleculaire 


Forme 


Indus 


Refractivite molaire 


Topo 1 oqique 


Indus 


Lipophilie (LoqP) 


Topol oqique 


Indus 


Kappa 1 


Topoloq-icrue 


Exclu 


Kappa 2 


Topolocfique 


Exclu 


Kappa 3 


Topol ocr ique 


Exclu 


Kappa Alpha 1 


Topo Icq ique 


Exclu 


Kappa Alpha 2 


Topulogiaue 


Indus 


Kappa Alpha 3 


T< >pol oqique 


Exclu 


Fl exibilite 


Topol oqique 


Indus 


Kier Chi V4 


Topol oqique 


Indus 


Indice Randic 


Toot yl ocricfue 


Exclu 


Indice Balaban 


Top< )1 oqique 


Indus 


Indice Wiener 


Topol oqique 


Pixel u 


Soirune etat E 


Physique 


Excl u 



Mo m e n t d i \ ■ o 1 a i r e 


Phys ique 


I no 1 us 


Nombre d ' at < omes de C 


ChimioTLie 


Excl u 


Nombre d'at'Mes^ de 0 


Ch i mi que 


I no 1 us 


Nombre d'atomes do N 


Chimique 


I no 1 us 


Nombre d' atonies de H 


Ch imicfue 


£xc J u 


Nombre total d 'a t: o/nes 


Chimicfue 


Excl u 


Nombre de ai'oupes methyie 


C llJ-lll-L^Lltr 


Exc 1 u 


Nombre de groupes ethyl e 


Chimique 


Indus 


Non±)i'e de cjroupes amino 


Ch imicfue 


Excl u 


Nombre de qroupes hydroxy 


Chimique 


Indus 



Les desoripteurs topolog iques listes ci-dessus ont ete 
utilises pour calculer les f litres statiques . Treize 
desoripteurs (en ecriture droite) , ont fourni des informations 
sur les oaraoteristiques des peptides ayant une act i vi te immuno- 
modulat r.ioe et ont ete utilises pour definir des contraintes 
pour cribler une bibliotheque combinatoire virtuelle. Les 
guator::e autres desoripteurs se sont reveles etre intercorreles 
et ont ete excius de 1 1 analyse . 

En utilisant le programme COMBEX (Synt:em, Nimes , France), 
on a qenere une explosion combinatoire basee sur une sequence 
consensus RXXXRXXXXY , derivee de 1 'ensemble d 1 apprent issage , 
apres alignement de toutes les sequences actives et inactives . 
Cette sequence a laisse 7 positions, les positions representees 
par H X'\ pour effectuer des mutations afin de creer la 
bibl iotheque . 

'Pontes ies molecules ont ete generees en utilisant la 
convention SMILES puis convert ies en une structure 3D en 
ut ills an- le logiciel COR1NA (Oxford Molecular Group, Oxford, 
Royaume -Ln i ) . 

Ini tialement , des aeides amines tant naturels que non 
natureh; etaient eompris dans la base de donnees de 
5;ubsr i Riants . Tous les a^oder amines etaient deer its en termes 
c\ t , propriotes physics chimiques (iipophilie, basicite, 

.uomat c ■ . etc.) et oga Kuiiont. par des descr i pt eurs 
♦ q , , , ; . r: . -.: pma.lysc do Kier, indieo Balaban, etc.). En 
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utilisant 3 5 acides amines, cela conduisai.t. a 3^7 '"'ombinaisons, 
soil 64 milliards de composes, ce qui eta it encore t rop 
i m{)ortanl pour la capacite de 1 * ord 1 nat our ati lise. 

Af in de diminuer ce nombr e , que J.ques donnees 
5 supplemental res relies que la distr ibution de la lipophilic, ont 
ete prises en compte. En fait, la structure du compose 
"conducteur" {2102 .75-84) presentait deux domaines lipophiles 
separes par des residus hydrophiles. Ceci suggerait qu'une telle 
distribution eta i t importante pour .1 'activi te. Afin de respecter 
10 cette distribution, la Demanderesse a decide d'utiliser, pour 
chacune des 7 positions, la liste suivante d' acides amines : V, 
t t t, W, L, nL (nL - norleucine) . Ainsi, le nombr e des composes 
de la bibliotheque a ete rainene a 67 combinaisons, soit 279 936 
composes . 

15 Pour cribler la bibliotheque combina toire virtue-lie, on a 

calcule "au vol", pour chaque structure generee par le logiciel 
COMBEX. 1* ensemble correspondant de proprietes. Ces proprietes 
ont ete analysees en utilisant les f litres stat. iques et les 
tiltres dynam iques predefinis, bases sur les contreiintes et on 

2() n'a retenu que les composes satisfaisant a toutes les 
contra intes . 

Les f litres stat iques, obtenus par les plages de variation 
( 3es descripteurs re terms eta lent bases sur 1 ' ensemble de 
contraint.es independantes de la conformation defini en utilisant 
25 1* ensemble d ' apprent issage de composes actifs et inactifs. Us 
ont ete congus en utilisant le logiciel VARIMAP <Synt:em, Nimes, 
France) . 

En criblant la bibliotheque de 279 93 6 composes avec ces 
f litres statiques, on a identifies 26 peptides qui sat isf aisaient 
30 a toutes les contra intes . Parmi ceux-ci les peptides ont ete 
etudies du point de vue de leurs espaces corif ormat ionnels 
( f i 1 tre dynamique ) et en part iculier 5 , appeles respec t ivement 
RDP1257, RDP1258, FDP1259, RDP1271 et RDP1277 ont ete etudies. 

Le caractere flexible des peptxdes a ete analyse en 
35 utilisant des simulations de dynamique mo 1 ecu 1 a i r e (MD) . 

Les simulations MD des peptides solvates avec des 
condit. i oris per i odiques ont ete ei: f ect uees en u t 1 1 i sant le 
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logieiel AMHEH 4 . 1 (oxt ord Molecular Group, Oxford, Koyaume 
Uni ) . 11 ut. llisait une dureo de 1015 ps i >our chaque pept. ide 
solvate. La const ante dielectrlque ot.e 1'eglee sur "1 'unite. La 
tempera t ure du systeme \ et e i n i t lalement poi't.oc pi-ocjress i vemen t 
S de 10 a 300 K, sur une periode de 1 ps . Pendant la simulation, 
on a ma.int._enu une temperature constant e de 300 ± 10 K en 
i:OU pIant a un bain oxter i eur avec une- duree de relaxation de 0,1 
ps . Le "pas" temper el choisi etait de 1 Is. Le temps de calcul 
etait approx imati vemen t de 0,5 li par ps . On a utilise une 

10 coupure "basee sur les residus" de 10 A pour toutes les 
interactions non liees. La liste des paires nori liees etait: 
remise a jour toutes les 10 fs et les coordonnees etaient 
recueiilies chaque ps pendant les tra j ectoires , ce qui a donne 
un ensemble; de 1015 conformations pour chaque tra j ectoire . Dans 

15 toutes les tra j ectoires , aucune contrainte n ( a ete appliquee aux 
atomes et aucun " terme parasite" n'a ete utilise dans 
1 1 express i on d ' energie . 

Chaque conformation a ete representee par un descripteur 
de tonne appeie le vecteur d * autocorrelation 3D ci-apres "3D- 

20 ACV" [Eur. J. Med. Chem . Chim. Theor . , vol. 19, page 61 
(1984)1. Un ensemble de 3D- ACV a ete calcule pour chaque serie 
de conformations obtenues par dynamique moleculaire (MD) puis 
tra it e en uti 1 isant les statistiques a plusieurs variables 
[Trends in QSAR and Molecular modelling 92 ESCOM Publishers, 

25 page 216 (1993)]. Ceci a ete realise en trois etapes principales 
( i ,:\ i i i ) : 

(i) Pour une conformation donnee de la molecule etudiee, 
ici un peptide, le descripteur 3D -ACV correspondant a ete 
caloule conune suit. Les distances entre toutes les paires 

30 d ' atomes ont ete calculees. La distribution de ces distances 
etait an veoteur dont chaque "boite" (bin) etait la somme de 
paires d 1 atomes dans une gamine specif ique de separation 
interat omique , c ' est a-dire ou deux atomes donnes etaient 
separes pai ur.t- distance comprise entre ( r 1 ) et r A. Dans ce 

35 travail, .1 e pas etait eqa 1 a 1 A. Evidemment, la moindre 
modification de la conformation de ladite molecule about it a un 
rharioonuMit , i* • la disnibut on dos (li.st.ances i n tera t omiques , done 
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a une modification du 3D ACV. Par consequent, ce descripteur est 
fun des plus effieaces pour repr.esenter les formes 
conforniat ionnei. les des molecules . 

(ii) Une traiectoire MD est 1 'ensemble des conformations 
adoptees par une molecule donnee pendant la simulation MD. Pour 
chaque conformation, le 3D -ACV correspondant a ete calcule "an 
vol" et memorise. Ce 3D- ACV multiple, fonction du temps est un 
descripteur du comportement dynamique de ladite molecule. 

(iii) pour la comparison des 3D ACV multiples 
representant les trajectoires de 1' ensemble de molecules 
analyse, on a applique une analyse de composants principaux 
( PC A) a chacun de ces 3D -ACV multiples. Cette transformation a 
reduit les dimensions de 1 ' ensemble de donnees a un nombre plus 
faible (dans le cas present, un espace 2D) et a aussi permis la 
projection de toutes les trajectoires de toutes les molecules 
sur un plan . Dans cet espace reduit, chaque molecule est 
representee par ur. ensemble de points, c'est a dire ses 
conformations pendant: toute la duree de la simulation MD, ce qui 
represents son espace conf ormat ionnei . Les molecules pouvaient 
ensuite etre compare**? 1 ' une a 1' autre en termes d'espaces 
conf onnat ionnei s. Les analyses des trajectoires et des e spaces 
conforrnationnels ont etc- calcules au moyen du logic i el MULTIDYN 
(3ynt:em, Nimes, France). 

Par utilisation d ' un f litre dynamique pour cribler les 
peptides en termes d'espaces conforrnationnels, il est apparu que 
4 de ces 5 peptides occupaient le meme espace conf ormat ionnei ou 
un espace tres similalre mais que l'uri, le RDP1277, etait 
different de ce point de vue . 

Ces 5 peptides ont ete synthetases et testes dans des 

essais biologiques de survie a 1'allo greffo du coeur . 

A une dose de 10 mg/ kg /jour, tous ces peptides, sauf le 
RDP1277, eta lent actifs ir. vivo. Aucune prolongation 
significative de survie a la greffe n'a ete observee apres La 
therapie avec le RDP1277 (MST - 9,0 1,4). En revanche, La 
therapie avec tous les autres peptides a permis une prolongation 
significative de la survie a la greffe, ailant de 11 a 13 lours. 
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Pes essars supp 1 ement a i i es aver le pept ide RDP1258 a des 
doses de 1 a 10 rng/kq .joui out revel e une e 1 f i car 1 1 e accrue de 
la therapie aux doses mf erir'iires . A une dose de I mg/ kg/ jour, 
30^ des souris ay ant recu une dl.lu-qrci.de de coeur ct trakees 
par le RDP1258 on survecu pendant plus de 100 jours, alors que 
le peptide de reference, 2705.75-84, prolongeait la survie a 
1 ' a 1 lo gref r e de coeur apres une therapie a raison de 
80 mg/ kg/ jour, tandis qu'aucun ef let n'etait. observe aux doses 
inferieures. De plus, aucuno survie de lonque duree a la gref fe 
n-a ete indui te par une therapie utilisant ce peptide de 
reference . 

Pa strategic selon 1 ' invention a done bien permis de 
concevoir de facon rationnelle plusieurs composes bioactifs dont 
l'activite s'est revelee superieure a celle des molecules 
actives de la base d ' apprent issage . 
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REVINDICATIONS 



1. Procede assiste par ordinateur pour 
prevoir, identifier et deer ire des molecules ayant un 
comportement recherche, notamment dans le domaine de la 
pharmacie, mettant en oeuvre une etape de model i sat ion 
moleculaire, une etape de constitution d ' une banque combinatoire 
et. une etape de selection des molecules potentiel lement 
interessantes, caracterise en ce qu'il comporte une etape de 
filtration des molecules candidates par un f litre dynamique 
representatif des contraintes de variations conf ormationnelles 
que do i vent. respecter les molecules pour presenter ladite 
activite ou par un filtre statique representatif d'une pluralite 

de descr ipteurs . 

2. Procede assiste par ordinal" eur pour 
prevoir, identifier et deer ire des molecules ayant un 
comportement recherche, notamment dans le domaine de la 
Pharmacie, selon la revindication 1 caracterise en ce qu'il 
comporte une etape prealable de filtrage statique pour reduire 
le nombre de molecules candidates et pour une etape ulterieure 

de f i 1 1 rat ion dynami que . 

3. Procede assiste par ordinateur pour prevoir, 
identifier et deer. ire des molecules ayant un comportement 
recherche, notamment dans le domaine de la pharmacie, selon la 
revendication 1, caracterise en ce qu'il eomprend 
essentiel lement les etapes successives consistant a : 

1) realiser une base d ' apprentissage a partir d'une 
famille de structures moleculaires connues composee d'une part 
de structures moleculaires actives presentant 1 'activite 
recherchee et d' autre part de structures moleculaires inactives 
connues depourvues de cette activite, ou commme presentant une 
activite faible, en utilisant des descripteurs appropries ; 

2) generer une explosion combinatoire de molecules a 
partir de la base d ' apprent issage ; 

3) effectuer un criblage des molecules ainsi 
generees sur la base de 1 ' enr ichissement , en termes de diversite 
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rnoleculairo, apporte par ehaquo molecule vis a vis des 
descr ipt.eurs choi 55 is ; 

4) soumett re les molecule;; ainsi ret enues a des 
tilt res stanques represents i i s des contramtes de variations 
structure] les, physico-chimiques et molecul aires auxquelles 
doivent repcndre les, molecules pour etre actives et , 
eventuel lenient, synthetiser et tester les molecules 

1 ec t i onueef ; 

c ) soumett re les molecule;; les plus prometteuses 
ainsi select ronnees a un filtre dynamique representat: i f des 
c .nt raint.es de variation confor mat i onne 1 1 e que doivent respecter 
los molecules poui etre actives ; 

t, ) synthetiser et tester les molecules ainsi 

selectionnees . 

4. Precede assiste par ordinateur pour prevoir, 
identifier et door ire des molecules ayant un comportement 
recherche, notamment dans le domaine de la pharmacie, selon la 
revendication 3, caracterise en ce que, si le resultat escompte 
n-est pas obtenu, ou s'll n'est obtenu que partiel lement , les 
et.apes 3) a 6) sent: repetees en modifiant les f litres. 

1 ■, . Precede assiste par ordinateur pour prevoir, 
identifier et deer ire des molecules ayant un comportement 
recherche, notamment dans le domaine de la pharmacie, selon la 
revendication 3 ou 4, caracterise en ce que le filtrage 
dynamique peut etre effectuee au moyen d'un logiciel qui permet, 
a partir de trajectoires de dynamique moleculaire, de 
caractenser les espaces conf ormationnels de molecules 
quelconques . 

6. Piocede. assiste par ordinateur pour prevoir, 
identifier et decrire des molecules ayant un comportement. 
recherche, notamment dans ie domaine de la pharmacie, selon 
1'une quelconque des revindications precedent es, caracterise en 
ce que, le filtrage dynamique met en oeuvre le descripteur de 
. . , ; . const it ue par le vect.eur d ' aut: ocorrelat ion 3D (3D-ACV). 

7. piocede assiste par- ordinateur' pour prevoir, 
i iont it ior et decrire- des m^e-uies ayant un comportement 
lecherche, not amnion t dans- le domaine de la pharmacie, selon la 
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Feuille auaDl rectification 



revendication 6, caract.eri.se en ce que le f iltrage dynamique 
consiste a ca.leu.ler un ensemble de 3D ACV pour chaque serie de 
conformations obtenues par dynamique molecul.ai.re (MD) puis 
tr aite en u t. i 1 i. san t 1. es statist iques a pi u s i. eu r s var i a b les en 
trois etapes principales (i a iii): 

(i) Pour une conformation donnee de la molecule etudiee, 
on calcule le descripteur 3D- ACV correspondant par determination 
des distances entre toutes les paires d'atornes et de la 
distribution de ces distances formant un vecteur dont chaque 
"bolte" (bin) est la somme de paires d'atornes dans une gamme 
specifique de separation intera tornique , 

(ii) On calculeet on memorise pour chaque conformation, le 
3D- ACV multiple correspondant "au vol" ; 

(iii) On procede a une analyse de composants 
principaux (PCA) a chacun de ces 3D- ACV multiples. 

9. Procede assiste par ordinateur pour prevoii , 
identifier et decrire des molecules ayant un comportement 
recherche, notamment dans le domaine de la pharmacie, selon la 
revendication £ S , caracterise en ce que le filtre statique met en 
oeuvre des descripteurs physico-chimiques et. topologiques dont 
une partie au moins est choisie parmr les descripteurs cites 

da n s 1 e t ab lean 1 1 . 

9. Molecule ayant. un comport ement recherche, 
notamment dans le domaine de la pharmacie, congue par le procede 
conforme a Dune au moins des revendicat ions precedentes . 

10. Molecule qui n'etalt pas anter ieurement connue 
pour presenter un comportement recherche, caracterise en ce 
qu'elle occupe un espace conf ormat ionnel identique ou tres 
voisin de 1 1 espace conformational d'une molecule de reference 
au moins, la molecule de reference etant prealablement. connue 
pour presenter le comportement recherche. 

11. Molecule qui n'etait pas anterieurement connue 
pour presenter un comportement recherche, caracterise en ce 
qu'elle presente cies plages de variation des descripteurs 
statiques identique ou tres voisin des plages de variation des 
descripteurs statiques d'une molecule de reference au moins , la 
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molecule de reference etant ptedlabiement connue pour presenter 
le comportement recherche . 

12. Molecule qui n' eta it pas an tor ieurement connue 
pour presenter un comport ement. recherche, selon la revindication 
]0 et n caracterise en ce qu'elle occupe un espace 
conformationnel identique ou tres voisin de 1 1 espace 
o.-nformationnel d ' une molecule de reference au morns, la 
molecule de reference etant preal ablement connue pour presenter 
le comportement recherche et en ce qu'elle presente des plages 
de variation des descripteurs statiques identique ou tres voisin 
des plages de variation des descripteurs statiques d'une 
molecule de reference au moins , la molecule de reference etant 
prealablement connue pour presenter le comportement recherche. 
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: -v. 'iidiiMi ion i., earn"-: i : - • on eo que 1 e 1 i 1 tr -age civ i ram 1 qru 1 
e<>nsiste a 'aboub.u un ensemble de 3D-ACV pour" chaque sere- de- 
ft >:i i <>i n;at i or::; < a it eniit.-: ' pan dyn. uni que mo .1. ecu la i re ( MI) ) pu i s 
i i d ito en ut ... .1 ; sant ;es : t .a t i s V i ques a plusieurs var :i .ah 1 .es en 
5 ! ie b s el ape:; pa in • : pa '• • -a ( .. a i i i ) : 

( i ) Pour ane eonlomati on donnee de la molecule etudiee, 
on e, i ! eu 1 e : e descr i pt em" b ; ACV .:orrespondant. par de terminal:, i on 
ri ( .;:.; distances entre t outes 1 en paires d ' atomes et de la 
d.ist ! bias ...ion de a 1 :; 3b at arises lormant. van vecteur dont chaque 
10 "Soiie" (bin) eio la somme de p.dres d'atomes dans une gamine 
spor i. 1 ique do a- a > e at i. eei i lUerat omi que , 

On cabas boat on inemori so pour c ha que conforrnaP ic-rp le 
3 !)--■- ACV mil i t i p 1 e cor res pendant " au vol" ; 

vl: i ; on pe .obd^ a une analyse de composants 
15 principalis ( P 3A ) a ciiacai; ■ ie ces d~> ACV multiples. 

3 „ par. o; a ■< it. • assiste par ordinateur pour prevoir , 
<ien t: i f i er e ' dec r i : e dos mo 1 ecu les ayant. un comport: ement 
recherche, notarnment da::;:; ]e domaine de la pharmacie, selon la 
revtaidi ca 4 :. ian 3, causae vosi.se en ce que le filtre statique met. en 
30 rwaivre dec descr apteu rs physi co-::himiques et topologiques dorJ: 
use- par tie a a moi ras es: cho isie panni les descripteurs cites 
d ana a e tab I eau i I . 

• i . P*. » 1 o: - il l < • ayant un comportement recherche, 
notarnment dans le dorn.ii.ne de la pharmacie, concue par le procede 
25 con forme a 1. 1 une aa mo ins des revendications precedentes . 

10 . Mole.ajl.a qui n' etait pas anter ieurement connue 
pour proses' or an compor t ement recherche, caracterise en ce 
qu'elle occupe un ospace conformational identique ou tres 
voi sin do 1 ' espace o.)n : or ma t ionne .1 d 1 une molecule de reference 
30 au moms, la rnol .csu.be ae re l erense etant preal ablement connue 
presenter le caaier a ■ i.a omen t recherche. 

11. Molecule qui. n' etait pas anter ieurement connue 
h ,rr i i presenter un .amport ement recherche, caracterise en ce 
< 2U • t d I o present o ale; plaqca de variation des descripteurs 
35 at :J r iqucs idont nia- ou ' : -a. voisin des plages de variation des 
q..a.'- r in* • o ,: ? at ere-e b'ure mobaeule de reference au moins, la 



